روشی کارا برای کاوش مجموعه اقلام پرتکرار در تحلیل دادههای سبد خرید
نویسندگان
چکیده مقاله:
Discovery of hidden and valuable knowledge from large data warehouses is an important research area and has attracted the attention of many researchers in recent years. Most of Association Rule Mining (ARM) algorithms start by searching for frequent itemsets by scanning the whole database repeatedly and enumerating the occurrences of each candidate itemset. In data mining problems, the size of data is often too large to fit in main memory. However, in some cases such as records of sales of a large supermarket, the probability of a particular item to be present in a transaction is often very low. This is due to the fact that a large number of items are usually available for purchase and also the fact that a small set of items is purchased by a customer in a shopping. In this paper, we make use of these facts to propose an efficient method for mining frequent itemsets. In our approach, the database is scanned just once, and data is encoded into a compressed form and held in a proper data structure in main memory. In each iteration, the time required to measure the frequency of itemsets, is reduced further (i.e., enumerating n-dimensional candidate itemsets is much faster than (n-1)-dimensional itemsets). We evaluate the efficiency of our technique using both synthetic and real-life datasets and compare it with other ARM methods proposed in past research
منابع مشابه
روشی کارا برای کاوش مجموعه اقلام پرتکرار در تحلیل داده های سبد خرید
کشف الگوهای پنهان و ارزشمند از درون حجم وسیعی از دادههای خام، اخیراً توجه بسیاری از محققان را به خود جلب کردهاست. اغلب روشهای کاوش قوانین تداعی در مرحله اول کار خود کلیه اقلام پرتکرار (ساده و ترکیبی) را از بین تمام اقلام موجود در دادهها جستجو میکنند که این امر نیازمند به خواندن مکرر کل دادهها از دیسک است. در مسائل دادهکاوی، حجم پایگاه دادههای تراکنش معمولاً آنقدر زیاد است که قابل بار شدن د...
متن کاملرتبهبندی واحدهای کارا در تحلیل پوششیدادهها از طریق تضعیف واحد تحت بررسی در مجموعه امکان تولید
This paper presents a model for ranking efficient units by a new approach. In the proposed method, the idea of excluding the unit being scored from the production possibility set is changed to the idea of weakening the unit being scored. We propose a model for ranking efficient DMUs that is more efficient and less problematic than the models based on excluding the under evaluation unit.
متن کاملارائه روشی کارا برای دستهبندی مسائل چنددستهای با رویکرد انتخاب دستهبند
سیستمهای دستهبندی شورایی، رویکردی مؤثر در یادگیری ماشین است که در آن با ترکیب نتایج چند دستهبند سعی میشود تقریب بهتری از یک دستهبند بهینه فراهم شود. در حوزه ترکیب خروجی شورای دستهبندها، رویکرد «انتخاب دستهبند» توجه کمتری را در مقایسه با رویکرد «ادغام دستهبند» به خود جلب کرده است. همچنین، اغلب روشهای موجود در این حوزه، هزینه محاسباتی بالایی دارند. در این مقاله، روشی مؤثر در دسته بندی مسائل ...
متن کاملتحلیل گفتمانی؛ روشی برای تحلیل بازتاب انقلابها
انقلابها علاوه بر بعد ملی و سرزمینی دارای بازتابهای فراملی و جهانی هستند. نظریهپردازی در مورد این بعد از انقلابها بهطور عام و در مورد انقلاب اسلامی ایران بهطور خاص کمتر مورد توجه بوده است. این مقاله با استفاده از نظریه تحلیل گفتمان لاکلائو وموف در پی توجه به این بعد بوده و در صدد است به این سؤال پاسخ دهد که از منظر تحلیل گفتمان لاکلائو وموف، قابلیت و نحوه بازتاب یافتن یک گفتمان انقلابی ه...
متن کاملروشی کارا برای پیش بینی ریزش مشتری
با توجه به اشباع شدن بازارها و افزایش رقابت کسب و کارها، امروزه هزینه ی جذب یک مشتری جدید به مراتب بیشتر از حفظ یک مشتری موجود است. بنابراین اهمیت مدیریت ریزش مشتری روز به روز برای کسب و کارها بیش تر می گردد. از طرفی با ظهور تکنولوژی داده کاوی و پیشرفت سریع آن، و همچنین با افزایش اطلاعات ذخیره شده در سازمان ها در ارتباط با مشتریان، کسب و کارها متمایل به استفاده از این تکنولوژی برای استخراج دانش...
15 صفحه اولمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
عنوان ژورنال
دوره 19 شماره 7
صفحات 65- 74
تاریخ انتشار 2009-01
با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.
کلمات کلیدی برای این مقاله ارائه نشده است
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023